Płatki i kielich w kwiatach Irysów - czy ich wielkość jest zależna od siebie?¶

Analiza cech morfologicznych dla 3 gatunków Irysa¶

W ramach niniejszej analizy postaram się odpowiedzieć na pytanie czy istnieją zależności pomiędzy długością a szerokością płatków oraz kielicha w kwiatach 3 gatunkach Irysa. W tym celu wykorzystam dane dotyczące cech morfologicznych 3 gatunków Irysa (Iris setosa, Iris versicolor, i Iris virginica).

1. O samych danych¶

  • Nasz zbiór składa się z 5 kolumn oraz 150 rzędów. Ogromna większość danych to dane liczbowe dotyczące wielkości płatków oraz kielicha kwiatów (w cm) z podaniem przynależności do jednego z 3 gatunków Irysa (jego klasy).
  • Ilość danych dla każdego z 3 gatunków jest równomiernie rozłożona (po 50 próbek na gatunek).

3. Pierwsze wnioski¶

Na podstawie wstępnej analizy podstawowych statystyk dla całego zbioru 3 gatunków możemy zaobserwować różnice w odchyleniach standardowych dla poszczególnych cech morfologicznych kwiatów Irysa. Największe odchylenie mamy dla cechy "długość płatka" zaś najmniejsze (3-krotnie mniejsze) dla cechy "szerokość kielicha".

Pozwala nam to wysnuć wniosek iż mamy dużą różnorodność w długości płatków dla naszych 3 gatunków, podczas gdy różnorodność dla "szerokości kielicha" jest dużo mniejsza, tak jakby cecha ta była raczej stała dla Irysa.

No description has been provided for this image

Przyjrzymy się temu zagadnieniu bliżej przy analizie cech dla poszczególnych gatunków.

4. Robimy analizę pojedynczych cech¶

Po przeanalizowaniu mediany dla cech morfologicznych z podziałem na gatunki (klasy) możemy ponownie dojść do wniosku iż poszczególne gatunki zazwyczaj nieznacznie różnią się parametrami kielicha, lecz zazwyczaj bardzo różnią się długością i szerokością płatka. Najdłuższe i najszersze płatki ma Iris-virginica, a najkrótsze i najszersze Iris-setosa.

Mediany cech dla poszczególnych gatunków
  klasa długość kielicha szerokość kielicha długość płatka szerokość płatka
0 Iris-setosa 5.000000 3.400000 1.500000 0.200000
1 Iris-versicolor 5.900000 2.800000 4.350000 1.300000
2 Iris-virginica 6.500000 3.000000 5.550000 2.000000

I analogicznie, przy przeanalizowaniu odchylenia standardowego można stwierdzić iż najbardziej powtarzalne (najmniej rozrzucone) pomiary dotyczyły szerokości płatka i w szczególności dotyczy to Iris - setosa. Może to wynikać z błędu pomiaru, gdyż jest to gatunek o najmniejszych płatkach (ok 1,5 cm) co łatwo zmierzyć, w przeciwieństwie do dłuższych płatków 5 cm które mogły zawijać się podczas pomiaru i wpływać na jego precyzję.

Odchylenie standardowe cech dla poszczególnych gatunków
  klasa długość kielicha szerokość kielicha długość płatka szerokość płatka
0 Iris-setosa 0.352490 0.381024 0.173511 0.107210
1 Iris-versicolor 0.516171 0.313798 0.469911 0.197753
2 Iris-virginica 0.635880 0.322497 0.551895 0.274650

Zobaczmy jeszcze jak dane prezentują się na histogramach z podziałem na poszczególne cechy.

Histogramy również ukazują nam iż szerokość kielicha jest w miarę podobna dla wszystkich 3 gatunków (odchylenie jest rzędu +- 1, natomiast widzimy dużą różnorodność wyników dla pozostałych 3 parametrów. Niestety na wykresie nie możemy rozróżnić, których gatunków to dotyczy. Spróbujemy to sprawdzić w następnym kroku.

No description has been provided for this image

Po pogrupowaniu danych wg gatunku i narysowaniu wykresu słupkowego mamy potwierdzenie iż Iris virginica ma średnio największy kwiat, gdyż wszystkie parametry są w nim najdłuższe poza szerokością kielicha (ten jest najszerszy u Iris setosa). Iris setosa jest z kolei najmniejszy, choć nie pod względem wymienionej właśnie szerokości kielicha.

No description has been provided for this image

5. Analizujemy relacje pomiędzy zmiennymi¶

Teraz zagłębimy się już całkowicie w zbadanie relacji pomiędzy poszczególnymi cechami morfologicznymi dla wszystkich 3 gatunków Irysa. Przypominam, że głównym celem naszej analizy jest odkrycie czy one istnieją. Jeśli tak to na czym polegają?

Na podstawie analizy mapy korelacji cech możemy zaobserwować silną zależność pomiędzy długością płatka, a długością kielicha. Płatek kwiatu zaczyna się w głębi kielicha, więc przy większych płatkach kielich też musi być większy. Ten wniosek mógł być do przewidzenia. Jednakże ciekawostką jest drugi wniosek - występuje silny brak zależności między długością zarówno płatka jak i kielicha a szerokością kielicha. Oznacza, to że kielich ma niejako stałą szerokość dla wszystkich 3 gatunków, niezależnie od wielkości kwiatu. To spostrzeżenie dodatkowo potwierdzają wyniki z mediany - szerokość ma średnio ok 3,1 cm. Wynika to zapewne z funkcji jaką pełni kielich - zawiera on pręciki oraz pyłek, które chroni, widocznie ta szerokość jest optymalna dla wykonania tego zadania. Gatunki mogą mieć różne długości płatków, by wabić mniejsze lub większe owady, ale zadanie kielicha pozostaje niezmienne.

No description has been provided for this image

Zobaczmy jeszcze zależność długości płatka od długości kielicha na wykresie punktowym.

Znów możemy zaobserwować zależność pomiedzy omówionymi wyżej cechami, ale dodatkowo wyłania nam się ciekawostka w lewym dolnym rogu wykresu - mamy tam dużą grupę punktów, które wyłamują się z korelacji, długość płatka jest niejako stała wraz ze wzrostem długości kielicha. Dane te muszą dotyczyć gatunku Iris setosa, gdyż jego wartości długości płatka nie przekraczały 2 cm. Musimy przyjrzeć się temu bliżej. Czyżby jednak dla tego jednego gatunku nie było korelacji między długością płatka a kielicha?

Na poniższym wykresie z podziałem na gatunki nasze przypuszczenia potwierdziły się - widzimy wyraźnie iż w przypadku Iris setosa nie ma korelacji pomiędzy długością kielicha a płatka, natomiast dla 2 pozostałych gatunków występuje. Może to wynikać z faktu iż kielich jest zależny od długości płatka, ale powyżej pewnej długości". Zapewne, z uwagi na swe (omówione wcześniej) funkcje ochronne dla pręcików i pyłku kielich musi być długi na przynamniej 4-5 cm, żeby je spełniać. Potem, wraz ze wzrostem długości płatka długość kielicha też może się zwiększać i wtedy występuje korelacja**.

No description has been provided for this image

Dla pewności, że korelacja występuje zobaczmy jeszcze jak wygląda macierz korelacji pogrupowana po gatunkach. Widzimy iż nasze tezy ponownie znajdują potwierdzenie w liczbach.

No description has been provided for this image

6. Analizujemy wartości odstające¶

Przeprowadzimy teraz detekcję wartości odstających w naszym zbiorze. Widzimy iż takowe wartości pojawiły się jedynie dla parametru szerokość kielicha. Tak jak wcześniej sugerowałem, z danych wynika iż wartość szerokości kielicha jest mniej więcej stała dla wszystkich 3 gatunków, podejrzewam, że te wartości odstające są wynikiem błędu pomiaru.

No description has been provided for this image

Po pogrupowaniu danych po klasie możemy zaobserwować dodatkowo inne zjawisko - najwięcej wartości odstających mamy dla gatunku Iris-setosa dla 2 parametrów: długość płatka oraz szerokość płatka. Ponieważ wartości tych cech dla tego gatunku są najmniejsze (spośród wszystkich 3 gatunków) wysnuwam zatem wniosek, że te wartości odstające również są wynikiem błędu pomiaru, który mógł wystąpić przy różnicach rzędu kilku milimetrów.

No description has been provided for this image

7. Wnioski końcowe¶

Po wykonaniu całej analizy możemy wysnuć następujące wnioski:

  • mamy do czynienia ze zbiorem 3 gatunków Irysa, każdy gatunek ma wykonane 50 pomiarów
  • gatunki różnią się głównie długością płatków oraz kielicha
  • najkrótsze płatki ma Iris Setosa, najdłuższe zaś Iris virginica
  • obserwujemy silną zależność pomiędzy długością płatka, a długością kielicha w całym zbiorze, płatek kwiatu zaczyna się w głębi kielicha więc przy większych płatkach kielich też musi być większy
  • jednocześnie występuje też silny brak zależności między długością zarówno płatka jak i kielicha a szerokością kielicha. Oznacza, to że kielich ma niejako stałą szerokość dla wszystkich 3 gatunków, niezależnie od wielkości kwiatu. Wynika to zapewne z funkcji jaką pełni kielich - zawiera on pręciki oraz pyłek, które chroni, widocznie ta szerokość jest optymalna dla wykonania tego zadania. Gatunki mogą mieć różne długości płatków , by wabić mniejsze lub większe owady, ale zadanie kielicha pozostaje niezmienne.
  • przypadku Iris setosa nie ma korelacji pomiędzy długością kielicha a płatka, natomiast dla 2 pozostałych gatunków jest. Może to wynikać z faktu iż kielich jest zależny od długości płatka ale powyżej pewnej długości. Z uwagi na swe omówione wcześniej funkcje ochronne dla pręcików i pyłku widocznie musi byc długi na przynamniej 4-5 cm, żeby je spełniać. Potem, wraz ze wzrostem długości płatka długość kielicha też może się zwiększać i wtedy występuje korelacja.
[NbConvertApp] Converting notebook Zadanie_mod_10_1_(Irysy).ipynb to html
[NbConvertApp] WARNING | Alternative text is missing on 8 image(s).
[NbConvertApp] Writing 5465652 bytes to Zadanie_mod_10_1_(Irysy).html